
为什么李飞飞团队经常cue通义千问?
为什么李飞飞团队经常cue通义千问?Qwen 3还未发布,但已发布的Qwen系列含金量还在上升。2个月前,李飞飞团队基于Qwen2.5-32B-Instruct 模型,以不到50美元的成本训练出新模型 S1-32B,取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型数学及编码能力相当的效果。如今,他们的视线再次投向了这个国产模型。
Qwen 3还未发布,但已发布的Qwen系列含金量还在上升。2个月前,李飞飞团队基于Qwen2.5-32B-Instruct 模型,以不到50美元的成本训练出新模型 S1-32B,取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型数学及编码能力相当的效果。如今,他们的视线再次投向了这个国产模型。
昨天,是国产 AI 六小虎之一百川智能成立的两周年,CEO 王小川发布全员信强调公司方向: “ 减少多余动作,专注医学方向。”要知道,两年前,百川智能刚成立的时候,其愿景可是 “ 旨在打造中国版的 OpenAI 基础大模型及颠覆性上层应用 ”,非常宏大。
神秘免费 AI 模型 Quasar Alpha 上线,性能出色引发关注
几乎每次重大产品发布前,Sam Altman 都会习惯性抛出「预告」,吊足网友的胃口,昨晚他也在 X 上化身谜语人,声称今天会推出一个「令人兴奋」的新功能。就在刚刚,这个新功能已经揭晓——全面升级的记忆功能。
AI 时代的 iPhone 会是什么?
OpenAI Academy 是 OpenAI 在2024年推出的免费AI教育平台,旨在普及人工智能知识、赋能更多人使用AI。该平台于2024年9月启动,最初聚焦服务开发者和技术团体,但在2025年3月宣布开放为面向大众的在线AI教育资源中心。
最近,像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型(Large Reasoning Models,LRMs)通过加长「思考链」(Chain-of-Thought,CoT)在推理任务上表现惊艳。
4 月 3 日消息,当地时间周三,Anthropic 发布了“Claude for Education”计划,宣布正式进军高等教育市场,以应对 OpenAI 的 ChatGPT Edu 方案。该计划将为高校师生和工作人员提供 Claude AI 聊天机器人,并额外配备一系列专门功能。
PaperBench 是一个由 OpenAI 开发的基准测试,旨在评估 AI Agent 复现尖端 AI 研究的能 力。它专注于测试 AI 是否能理解研究论文、独立开发代码并执行实验以复现研究结果。
由于 DeepSeek R1 和 OpenAI o1 等推理模型(LRM,Large Reasoning Model)带来了新的 post-training scaling law,强化学习(RL,Reinforcement Learning)成为了大语言模型能力提升的新引擎。然而,针对大语言模型的大规模强化学习训练门槛一直很高: